扫描下载APP
其它方式登录
阿里通义千问发布旗舰模型Qwen3.5-Max-Preview,在国际权威评测平台LM Arena获1464分综合得分,位列全球大模型公司第五、中国第一,标志着国产大模型进入全球第一梯队。
Sentient实验室推出Arena平台,面向全球AI开发者提供生产级环境,用于压力测试和迭代企业级AI智能体的推理可靠性。平台聚焦文档推理等高风险真实工作流场景,强调可解释、可复现、跨模型的结构化评测,获富兰克林邓普顿、Pantera等机构支持,旨在解决企业智能体从试点迈向规模化部署的信任与治理瓶颈。
Alpha Arena项目测试多个AI模型在加密货币交易中的表现,结果显示中国开源模型Qwen3和Deepseek盈利,而西方闭源模型亏损严重。项目旨在通过真实市场环境测试AI智能,强调风险调整和长期验证的重要性。